назад ко второму семестру

Программа BLASTP

1. Поиск белка по его последовательности

Возможно, разные значения E-value получаются от того, что разные базы данных содержат разное количество белков (от состава БД зависят какие-то количественные параметры сравнения белков, в том числе и E-value).

2. Поиск белка по его гомологу

Был произведен поиск в банке данных swissprot последовательности POA9G4 ("мой" белок), гомологичной POA9G5 (его последовательность подавалась на вход). Мой белок CUER_ECOLI найден со следующими параметрами:
Порядковый номер в выдаче: 1,
Score=282,
E-Value=2e-76,
начало и конец выравнивания во входной последовательности (Query) - 1 и 139,
начало и конец выравнивания в находке (Subject) - 1 и 139,
процент совпадений - 100%.

Белок, найденный первым, является тем самым белком, чья последовательность была подана на вход (то есть в моем случае - CUER_SHIFL, имеющий AC POA9G5).

3. Поиск белка по фрагментам его последовательности

Был произведен еще один поиск в банке данных swissprot. В качестве входной была использована искусственно созданная последовательность, склеенной из двух небольших участков последовательности POA9G4.
Порядковый номер в выдаче: 2,
Score=27.7,
E-value=8.0.
Начало и конец выравнивания во входной последовательности (Query): 13 и 24,
Начало и конец выравнивания в находке (Subject): 76 и 87,
Процент совпадений (Identity): 100%

По небольшому фрагменту выравнивание делать гораздо сложнее, и вес выравнивания получается на порядок меньше. Поэтому выдаётся мало гомологов. Зато процент идентичности в данном случае очень высок.


© Лозиер Екатерина